235 research outputs found

    MENGESTIMASI PARAMETER BUTIR PERANGKAT TES DENGAN PENDEKATAN REGRESI LOGISTIK MULTIVARIAT

    Get PDF
    Estimasi parameter butir perangkat tes biasanya dilakukan dengan pendekatan teori tes klasik atau teori respons butir (Item Response Theory, IRT) unidimensi. Untuk analisis ini, ada asumsi yang harus dipenuhi, salah satunya asumsi unidimensi, yakni suatu perangkat tes dianggap hanya mengukur satu kemampuan yang paling dominan saja. Pada kenyataannya di lapangan, asumsi ini sulit dipenuhi, karena sebagian besar tes kemampuan/psikologi bersifat multidimensi. Teori respons butir multidimensi mengatasi kelemahan ini, yang mengestimasi parameter butir melalui persamaan peluang menjawab benar dengan regresi logistik multivariat

    Assembling the Mathematics Test Using the Value of Information Functions

    Get PDF

    MENGESTIMASI KEMAMPUAN PESERTA TES URAIAN MATEMATIKA DENGAN PENDEKATAN TEORI RESPONS BUTIR DENGAN PENSKORAN POLITOMUS DENGAN GENERALIZED PARTIAL CREDIT MODEL

    Get PDF
    Dalam pelaksanaan tes uraian, penskoran biasanya dilakukan secara parsial berdasarkan langkah-langkah yang harus ditempuh untuk menjawab benar suatu butir soal. Penskoran dilakukan perlangkah dan skor perbutir diperoleh peserta diperoeh dengan menjumlah skor siswa tiap langkah, dan kemampuan diestimasi dengan skor mentah. Model penskoran seperti ini belum tentu tepat, karena tingkat kesulitan tiap langkah tidak diperhitungkan. Pendekatanl alternatif yang dapat digunakan yakni pendekatan teori respons butir untuk penskoran politomus, salah satunya dengan generalized partial credit model (GPCM). Pada artikel ini disajikan penskoran butir pada GPCM, model matematikanya, estimasi parameternya, dan estimasi kemampuan peserta disertai kasus dan pemanfaatan software Parscale dari SSi. Kata kunci: teori respons butir, generalized partial credit mode

    Stabilitas Estimasi Parameter Pada Regresi Logistik ( Suatu Penerapan Pada Pengukuran)

    Get PDF
    Pada paper ini dibahas tentang efek panjangnya tes, distribusi kemampuan peserta tes, dan banyaknya peserta tes terhadap kestabilan parameter (tingkat kesulitan (a), daya pembeda (b), tebakan semu (c) dan kemampuan peserta tes (θ)) pada teori respons butir unidimensi model regresi logistic tiga parameter. Data dibangkitkan dengan program DGEN, dengan variable panjang tes (20 butir dan 50 butir), distribusi kemampuan (N(‐1,1), N(0,1) dan N(+1,1), dan banyaknya peserta tes (300, 750, dan 1200). Pola kecenderungan diamati berdasarkan Mean Square of Error (MSE) dari parameter, koefisien korelasi antara parameter sebenarnya dengan parameter hasil estimasi, dan nilai fungsi informasi estimasi. Hasil penelitian menunjukkan bahwa ada kecenderungan MSE paling rendah terjadi pada data yang dibangkitkan dengan parameter kemampuan berdistribusi normal baku dan korelasi antara parameter estimasi dan parameter sebenarnya tidak memiliki pola yang pasti, jika dilihat dari distribusinya. Pada parameter a dan c, ada kecenderungan semakin besar ukuran sampel, semakin besar keakuratan pengestimasiannya, , namun untuk b dan θ tidak ada pola yang pasti. Melihat korelasinya, ada kecenderungan semakin semakin besar ukuran sample peserta tes, semakin dekat korelasi antara parameter hasil estimasi dengan parameter sebenarnya, namun hal ini tidak berlaku untuk parameter b. Berdasarkan rerata MSE dan rerata korelasi , ada kecenderungan semakin panjang suatu tes, akan semakin besar keakuratannya untuk mengestimasi parameter a, c dan θ. Namun sebaliknya, pada pengestimasian parameter tingkat kesulitan (b), semakin panjang tes akan semakin kurang akurat, karena semakin besar MSE‐nya. Demikian pula berdasarkan korelasinya. Kesalahan pengukuran estimasi (SEE), yang tidak dipengaruhi oleh distribusi dan ukuran sampel, tetapi pada studi ini hanya dipengaruhi oleh panjang tes. Berdasarkan hasil analisis signifikansi dengan analisis varians, distribusi kemampuan, panjang tes dan interaksi panjang tes dengan ukuran sample yang berpengaruh pada stabilitas estimasi parameter b saja

    THE COMPARISON OF ITEMS‟ AND TESTEES‟ABILITY PARAMETER ESTIMATION IN DICHOTOMOUS AND POLITOMUS SCORING (STUDIES IN THE READING ABILITY OF TEST OF ENGLISH PROFICIENCY)

    Get PDF
    This study aimed to compare the testees‘ ability estimation in the politomus and dichotomous scoring model. The data used in this study are the responses of testees to the Test of English Proficiency (TOEP) set 1 in reading subtest, which are usually scoring in dichotomous model then they are scoring in politomus model. In the reading subtest of TOEP, in one text presented several items related to the text. In the dichotomous scoring, each item is scored one by one item. As alternative, every item item is scored using dichotomous model separately, but for every text, the acquisition of these items are added to the score attained politomous model. The estimation of items‘ and abilities‘ parameter in dichotomous scoring were done using the Rasch models and in the politomous scoring were done with partial credit models using QUEST software. Comparative analysis of the two models are seen based on the average results of the estimated difficulty level, graphical analysis, calculating the correlation, and the results of the value of information function. The results of the analysis showed that the average item difficulty dichotomous scoring model is 0.486 with a standard deviation of 0.895 and the mean level of difficulty politomous scoring model is -0.105 with a standard deviation of 0.695. The correlations between abilities of participants using the dichotomous and the politomous scoring model is 0.94. The value of information function in the dichotomous scoring model is higher than in the politomous scoring models. These results indicate that the Reading of TOEP set 1,the dichotomous scoring model is better than the politomous scoring model

    PERBANDINGAN METODE PENYETARAAN TES PARALEL TANPA BUTIR BERSAMA (CONCORDANCE) BERDASARKAN TEORI TES KLASIK

    Get PDF
    Penelitian ini bertujuan untuk untuk mengetahui urutan ketepatan metode concordance dengan dengan pendekatan teori tes klasik (metode linear sejajar dan metode equipersentil). Selain itu, penelitian ini juga bertujuan bagaimana penerapan concordance pada pada perangkat tes IPA UAN SMP/MTs yang disusun oleh MKKS di lima kabupaten/kota di DI Yogykarta dengan menyusun tabel konversi yang dapat digunakan untuk mengukur keberhasilan pembelajaran IPA SMP/MTs di wilayah DI Yogyakarta. Pada penelitian ini, concordance dilakukan pada perangkat tes Ujian Akhir Sekolah untuk mata pelajaran IPA di Sekolah Menengah Pertama/Madrasah Tsanawiyah di DI Yogyakarta. Pengumpulan data dalam penelitian ini dilakukan dengan menggunakan teknik dokumentasi. Analisis data dilakukan melalui tiga tahap. Tahap pertama dilakukan untuk mengetahui karakteristik butir berdasarkan teori tes klasik. Tahap selanjutnya pada butir-butir soal yang baik, dilakukan concordance berdasarkan 3 metode penyetaraan berdasarkan teori tes klasik yakni metode linear, paralel linear dan metode equipersentil. Selanjutnya, keakuratan metode concordance diperbandingkan dengan melihat kesalahan standar penyetaraan. Pada tahap ketiga, dibuat skala konversi untuk penyekoran untuk tiap-tiap kabupaten. Hasil penelitian menunjukkan bahwa : (1) Penyetaraan tanpa butir bersama (concordance) skor tes UAS siswa SMPN 1 Paliyan mata pelajaran IPA tahun 2006/2007 ke skor tes UAS siswa SMPN 10 Yogyakarta dengan metode linear memenuhi persamaan plYk(x) = 1.22722 x + 5.0004, dan diperoleh hasil yang hampir sama untuk metode equipercentile, (2) dengan menggunakan metode linear, diperoleh RMSE sebesar 9.333964, sedangkan dengan metode equipersentil, diperoleh RMSE sebesar 9.326277, yang menunjukkan bahwa metode equipercentil sedikit lebih cermat dibandingkan dengan metode linear. Dan (3) tabel konversi hasil concordance pada penelitian ini terlampir. FMIPA, 2007 (PEND. MATEMATIKA

    Improving the Understanding of Research Methodology and Self-Regulated Learning Through Blog Project

    Full text link
    This classroom action research seeks to improve self-regulated learning (SRL) and understanding of research methodology at the graduate school. Nineteen graduate school students were involved. Using project-based learning (PjBL), students were assigned to create online blogs as the main project. The blog was intended for representing their understanding of research methodology by writing review of research articles and submitting a research proposal. The classroom action research was based on a model by Kemmis & McTaggart and was conducted in two cycles. The data were analyzed using mixed methods in which the main data were analyzed qualitatively and further analysed quantitatively. The results of the study showed that after completing the course, students not only gained knowledge about research methods, but were also able to write a research proposal. In addition, the project-based learning could facilitate students to practice their communication skills while writing on their blog and to improve self-regulated learning

    THE COMPARISONS OF RELIABILITY ESTIMATION ON THE COMPOSITE SCORE OF MATHEMATICS TEST

    Get PDF
    In a test, the final score was obtained as a composite of factors built up the test. The factors load in a test, would affect reliability of score of a test as composite of its factors. This study compared the reliability of the composite scores of mathematics test regardint its the loading factor. This study used the national examinations data of mathematics test in Junior High School, which was then analyzed using exploratory factor analysis to determine the loadingfactor in many cases basics on factors and long of the test. Furthermore the reliabilities estimated, and then compared with the H*-test and the Hakstian and Whalen test. The results showed that the analysis of 1-factor, the coefficient of reliability on a set of 20 items and a set of 25 items are higher than the original test load of 30 items. In the analysis of the two factors, the coefficient of reliability on a set of 15, 20, and 25 items are higher than the original test load of 30 grains when analyzed by one factor. In the analysis of the three factors, a set of 20 and 25 items have higher reliability coefficient compared with the original test load of 30 items when analyzed by one factor. Key words: reliability estimation, composite score, mathematics tes

    Karakteristik Perangkat Tes Ujian Masuk Program Pascasarjana Universitas Negeri Yogyakarta

    Get PDF
    Penelitian ini bertujuan untuk: (1) mengetahui karakteristik perangkat tes yang digunakan dalam program seleksi masuk program pascasarjana Universitas Negeri Yogyakarta ditinjau dari teori tes klasik dan teori respon butir, dan (2) mengetahui seberapa besar kesalahan pengukuran perangkat tes yang digunakan dalam program seleksi masuk program UNY berdasarkan teori tes klasik dan teori respon butir. Penelitian ini menggunakan pendekatan kuantitaif-deskriptif eksploratif dengan jenis penelitian kasus. Data utama yang digunakan berupa jawaban/respons peserta seleksi masuk program pascasarjana UNY tahun akademik 2010/2011. Pengumpulan data dilakukan dengan teknik dokumentasi, dengan cara mengutip respons calon mahasiswa terhadap perangkat tes seleksi masuk program pascasarjana UNY. Berdasarkan hasil penelitian diperoleh: (1) Karakteristik perangkat tes seleksi masuk program pascasarjana UNY adalah: (a) Tes Bahasa Inggris: Berdasarkan teori tes klasik terdapat 1 butir mudah, 67 butir sedang, dan 22 butir sukar, ditinjau daya pembedanya 53 butir baik dan 37 butir tidak baik, dan 39 butir memiliki distraktor baik, 51 butir memiliki distraktor tidak baik. Koefisien reliabilitasnya sebesar 0,753. Berdasarkan teori respons butir, dari 46 butir yang tidak di drop, 1 butir sukar, 8 butir sedang dan 37 butir mudah, (b) Tes Bakat Akademik: Berdasarkan teori tes klasik, 27 butir mudah, 49 butir sedang, dan 19 butir sukar. Ditinjau daya pembedanya, 63 butir baik dan 32 butir tidak baik, 64 butir memiliki distraktor baik, 51 butir memiliki distraktor tidak baik. Koefisien reliabilitas sebesar 0,857. Menggunakan teori respon butir, dari 77 butir tidak di drop, 16 butir sukar, 57 butir sedang dan 4 butir mudah, dan (2) Besarnya kesalahan pengukuran untuk masing-masing perangkat tes adalah: (a) Tes Bahasa Inggris, berdasarkan teori tes klasik sebesar 4,187 dan berdasarkan teori respons butir sebesar 0,198, (b) Tes Bakat Akademik, berdasarkan teori tes klasik sebesar 3,937 dan berdasarkan teori respons butir sebesar 0,138

    Perbandingan Akurasi Penggunaan Skala Likert Dan Pilihan Ganda Untuk Mengukur Self-regulated Learning

    Full text link
    Penelitian ini bertujuan untuk membandingkan akurasi penggunaan skala Likert dan bentukpilihan ganda untuk mengukur self-regulated learning (SRL). Instrumen pengukur SRL denganformat Likert dan pilihan ganda yang diskor berjenjang dikembangkan dengan kisi-kisi yang sama.Responden penelitian yaitu 125 mahasiswa Pendidikan Matematika Fakultas Matematika dan IPAUniversitas Negeri Yogyakarta. Karakteristik butir instrumen dianalisis dengan graded responsemodel menggunakan TESTFACT. Dengan menggunakan karakteristik butir-butir penyusun skala,nilai fungsi informasi perangkat dan kesalahan pengukuran standar diestimasi. Semakin tingginilai fungsi informasi perangkat, semakin tinggi akurasinya untuk mengukur SRL. Semakin kecilkesalahan pengukuran standar, semakin tinggi akurasinya untuk mengukur SRL. Hasil analisisdengan menggunakan nilai fungsi informasi dan kesalahan pengukuran standar menunjukkan bahwaperangkat menggunakan skala Likert lebih akurat dibandingkan dengan menggunakan pilihan gand
    • …
    corecore